# -*- coding: utf-8 -*-
# for python3
# アルバムから favorite の url リストを抽出する
'''
Created on 2010/08/11

@author: yohei
'''
import codecs
from optparse import OptionParser
import re
import sys

def main(argv):
	# オプション解析
	parser = OptionParser('parse favorite url')
	parser.add_option('-i', '--input', action='store', type='string', dest='in_path', help='input path')
	parser.add_option('-o', '--output', action='store', type='string', dest='out_path', help='output path')
	(options, args) = parser.parse_args(argv)

	# オプションエラーチェック
	if not options.in_path:
		parser.print_help()
		parser.error('引数が足りません')

	# 読み込む
	f = codecs.open(options.in_path, 'r', 'utf-8')
	fileimage = f.read()
	f.close()
	
	# line 毎に処理
	url_list = []
	for line in fileimage.split("\n"):
		m = re.search('<a href="(/photo/favorite_[0-9_]+\.html)">', line)
		if m:
			url_list.append(m.group(1))
			
	# 結果出力
	f = open(options.out_path, "w")
	f.write('\n'.join(url_list))
	f.close()


if __name__ == "__main__":
    #import sys;sys.argv = ['', 'Test.testName']
    main(sys.argv)
